# 百度贴吧图片下载
# 1, 通过requests拿到网页的源代码数据
# 2, 通过lxml对源代码数据进行解析， 拿到图片的url网址
# 3, 依次对图片地址发送网络请i去
# 4，把图片原始内容写入图片文件



import requests  # 请求网页相关的内容模块
from lxml import etree    # etree的功能主要是筛选

index_url = 'https://tieba.baidu.com/p/5475267611'

response = requests.get(index_url).text   # .text后缀是将html网页解析unicode数据
# print(response)

selector = etree.HTML(response)  # html文档元素补齐


# 获取元素
# image_urls = selector.xpath('//img[@class="BDE_Image"]')  # 这个显示的是元素简介
image_urls = selector.xpath('//img[@class="BDE_Image"]/@src')
print(image_urls)   # 格式是列表


ret = 0
for image_url in image_urls:
    image_content = requests.get(image_url).content   # content是字节流数据，常常用于图片，视频，音乐，多媒体文件

    with open(f'{ret}.jpg', 'wb') as f:
        f.write(image_content)

    ret += 1



